"""
Version: 0.1
Author: CarpeDiem
Date: 2022/3/18
Description: 词频统计
"""
'''
春词郑燮清代春风，春暖，春日，春长，春山苍苍，春水漾漾。
春荫萌，春浓浓，满园春花开放。门庭春柳碧翠，阶前春草芬芳。
春鱼游遍春水，春鸟啼遍春堂。春色好，春光旺，几枝春杏点春光。
春风吹落枝头露，春雨湿透春海棠。
'''
import re

sentence = input('请输入一段话：')

# 文本预处理
pattern = re.compile(u'\t|\n|\.|-|:|;|\)|\(|\?|,|，|。|"')  # 定义正则表达式匹配模式
sentence = re.sub(pattern, '', sentence)  # 将符合模式的字符去除

word_total_number = len(sentence)
word_dict = {}
for word in sentence:
    word_dict[word] = word_dict.get(word, 0) + 1

new_word_dict = sorted(word_dict.items(), key=lambda x: x[1],
                       reverse=True)  # 按出现次数排序, 返回一个列表
print(new_word_dict)
word_iterate_number = 0
for item in word_dict:
    if word_dict[item] > 1:
        word_iterate_number += 1

print('这段话中总共有{}个字符, {}字符重复, 重复最多的字符为{}'.format(word_total_number,
                                                word_iterate_number,
                                                new_word_dict[0][0]))